#!D:/CODE/python
# -*- coding: utf-8 -*-
# @Time : 2020/6/19 19:19
# @Author : Alexdong
# @Site : 
# @File : pandas 获取电影评分的平均分.py
# @Software: PyCharm
# Functional description: 假设有一组10年的1000部最流行的电影数据，想得到数据中评分的平均分，导演人数等信息，如何获取、

import pandas as pd
import matplotlib as plt
import numpy as np

file_path = ".csv"
df = pd.read_csv(file_path)

print(df.info())

print(df.head(1)) # 第一行

# 获取电影评分
df["Rating"].mean() # mean()
# 获取导演人数
print(len(set(df['Director'].tolist())))
print(df['Director'].unique())  # unique()出现了一次就不会再出现了

# 获取演员的人数
temp_actor_list = df["Actors"].str.split(", ").tolist()  # 得到一个所有演员的列表
# np.array(temp_actor_list).flatten()  # 将列表展成一维的
actors_list = [i for j in temp_actor_list for i in j]  # 嵌套循环变一维
actors_num = len(set(actors_list))
print(actors_num)

